Indexation de blocs extraits de pages Web en utilisant le rendu visuel
نویسنده
چکیده
RÉSUMÉ. Cet article présente un modèle d’indexation de pages Web basé sur leur rendu visuel. Dans ce modèle, une page Web n’est plus considérée comme un tout, mais comme la combinaison d’un ensemble de blocs dont chacun porte sa sémantique propre. L’indexation d’une page Web est réalisée en deux étapes : (1) construction d’un arbre hiérarchique de blocs visuels, en s’appuyant sur la disposition visuelle des blocs de la page (2) indexation textuelle de chaque bloc par un vecteur de termes et tenant compte de l’importance de ces blocs et de l’indexation des blocs contenants, contenus ou voisins.
منابع مشابه
Un modèle de recherche d'information dans des pages Web structurées en blocs
Dans le contexte de la recherche d’information sur le Web, nous présentons ici un modèle pour l’indexation et l’interrogation de pages Web utilisant aussi bien le contenu textuel que leur rendu visuel. Une page Web est considérée comme un ensemble de blocs contenant de l’information multimédia. La représentation visuelle d’un bloc (taille de police, couleur de fond, . . .), ainsi que sa taille ...
متن کاملWeb pages segmentation for document selection in Question Answering (Pré-segmentation de pages web et sélection de documents pertinents en Questions-Réponses) [in French]
Dans cet article, nous présentons une méthode de segmentation de pages web en blocs de texte pour la sélection de documents pertinents en questions-réponses. La segmentation des documents se fait préalablement à leur indexation en plus du découpage des segments obtenus en passages au moment de l’extraction des réponses. L’extraction du contenu textuel des pages est faite à l’aide d’un extracteu...
متن کاملUne Nouvelle Approche pour l'Adaptation d'un Hypermédia Pédagogique au Profil Cognitif de l'Apprenant en Utilisant XML
Il existe plusieurs travaux sur les hypermédias adaptatifs ;Très peu se sont intéressés à l’adaptation de la forme en fonction de profils cognitifs . Dans ce travail, notre intérêt porte sur l’adaptation des contenus des pages et des liens en se basant sur le modèle de connaissances de l'apprenant et en fonction d’objectifs pédagogiques, et sur l’adaptation de la présentation en fonction du pro...
متن کاملClustering visuel semi-interactif
Résumé. Nous proposons dans cet article une approche de clustering visuel semi-interactif. L’approche proposée utilise la perception visuelle pour guider l’utilisateur dans le processus interactif. Les clusters sont extraits de manière successive et itérative, puis évalués selon leur ordre d’extraction. Pour l’utilisateur, l’approche semi-interactive permet non seulement d’évaluer les classes e...
متن کاملAsservissement visuel par imagerie médicale
Résumé Cet article présente les avancées récentes dans le domaine de l’asservissement visuel par imagerie médicale, réalisées notamment depuis les dernières JNRR’07. Le domaine applicatif concerne la robotique médicale où la tâche est réalisée selon un schéma de commande en « boucle fermée » utilisant directement l’information visuelle fournie par une modalité d’imagerie médicale telles l’endos...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2008